Набросал на C++ черновик программы. Читаем текстовый файл (только utf8), сегментируем, парсим, результаты выводим в XML, заодно ищем в результатах парсинга некоторых важные составляющий и копим по ним статистику.
Это, конечно, совсем игрушечная программка и не тянет пока на автореферирование, но с ней можно попробовать добиться реальной
(
Read more... )